Common Voice优化
Whisper Medium Portuguese
Apache-2.0
基于openai/whisper-medium在common_voice_11_0数据集上微调的葡萄牙语语音识别模型,词错误率6.5987
语音识别
Transformers
其他
W
pierreguillou
191
28
W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500
基于facebook/wav2vec2-large-xlsr-53在Common Voice日语数据集上微调的语音识别模型
语音识别
Transformers
W
qqpann
15
0
Xls R 300m Es
Apache-2.0
基于西班牙语Common Voice数据集微调的语音识别模型,采用facebook/wav2vec2-xls-r-300m架构,在测试集上WER达到14.6%
语音识别
Transformers
西班牙语
X
polodealvarado
23
4
Wav2vec2 Large Xlsr 53 German With Lm
Apache-2.0
这是一个基于XLSR Wav2Vec2架构的德语自动语音识别模型,带有语言模型支持,在Common Voice德语数据集上表现出色。
语音识别
Transformers
德语
W
aware-ai
19
7
Wav2vec2 Base Turkish
Apache-2.0
该模型是基于Common Voice土耳其语数据集微调的Wav2Vec2语音识别模型,在土耳其语自动语音识别任务上表现优异。
语音识别
Transformers
其他
W
cahya
49
4
Wav2vec2 Xls R 300m Hy
Apache-2.0
基于facebook/wav2vec2-xls-r-300m模型在亚美尼亚语数据集上微调的自动语音识别(ASR)模型,支持亚美尼亚语语音转文字任务。
语音识别
Transformers
其他
W
arampacha
25
0
Wav2vec2 Large Xlsr 53 French
Apache-2.0
这是一个基于XLSR-53大模型微调的法语语音识别模型,在Common Voice数据集上训练,支持高准确率的法语语音转文本。
语音识别
法语
W
jonatasgrosman
47.83k
11
Xls R Spanish Test
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在西班牙语Common Voice 7数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
西班牙语
X
pablouribe
29
0
Wav2vec2 Large Fr Voxpopuli French
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli微调的法语语音识别模型,在Common Voice 6.1法语数据集上训练,支持16kHz音频输入
语音识别
法语
W
jonatasgrosman
51
3
Wav2vec2 Large Xlsr 53 Spanish With Lm
Apache-2.0
这是一个基于Wav2Vec2-Large-XLSR-53的西班牙语语音识别模型,增加了语言模型支持,显著提升了识别准确率。
语音识别
西班牙语
W
patrickvonplaten
2,198
8
Wav2vec2 Xls R 300m Cv8 Turkish
Apache-2.0
基于facebook/wav2vec2-xls-r-300m微调的土耳其语自动语音识别模型,在Common Voice 8.0 TR数据集上训练
语音识别
Transformers
其他
W
mpoyraz
382
3
Wav2vec2 Large Xlsr 53 Persian
Apache-2.0
针对波斯语优化的XLSR-53大模型语音识别系统,基于facebook/wav2vec2-large-xlsr-53架构微调
语音识别
其他
W
jonatasgrosman
257.76k
22
Wav2vec2 Large Xlsr 53 Punjabi
Apache-2.0
这是一个基于Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10在Common Voice数据集上微调的旁遮普语自动语音识别模型
语音识别
Transformers
其他
W
kingabzpro
189
2
Xlsr Kurmanji Kurdish
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在库尔曼吉库尔德语数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
X
Akashpb13
60
13
Wav2vec2 Large Xlsr 53 French Punctuation
Apache-2.0
基于wav2vec2-large-xlsr-53架构的法语自动语音识别模型,支持标点符号预测
语音识别
法语
W
Ilyes
23
0
Wav2vec2 Xls R Sl A2
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SL)数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
W
DrishtiSharma
24
0
Central Kurdish Xlsr
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在库尔德语中部方言上微调的自动语音识别模型,在Common Voice 8.0数据集上训练。
语音识别
Transformers
其他
C
Akashpb13
45
4
Wav2vec2 Large Xls R 300m Bashkir Cv7 Opt
Apache-2.0
这是一个基于Facebook的wav2vec2-xls-r-300m模型在巴什基尔语Common Voice 7数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
W
AigizK
102
0
Hindi Base Wav2vec2
Apache-2.0
这是一个基于wav2vec2架构的印地语自动语音识别(ASR)模型,在Common Voice等数据集上进行了训练。
语音识别
Transformers
其他
H
Harveenchadha
49
2